Residencia de Epidemiología
La gestión de datos vinculada a procesos de investigación o vigilancia epidemiológica implica la organización, la planificación, el almacenamiento, la preservación y la difusión de los datos antes, durante y despues de la etapa de análisis.
La ciencia abierta tiene como objetivo hacer que la investigación y la difusión científicas sean accesibles para todos, lo que hace absolutamente necesaria la necesidad de buenas prácticas de gestión de datos.
Marco de ciencia abierta: Centro para la Ciencia Abierta
Iniciativa y hoja de ruta de ciencia reproducible, ética y colaborativa: The Turing Way
Fuente primaria:
Fuente secundaria:
Un dato contiene la mínima unidad de información y desde la óptica informática es una representación simbólica (numérica, alfabética, etc) de un atributo o característica de una entidad.
En nuestro trabajo el dato siempre representa el valor / medida (variables cuantitativas) o modalidad / categoría (variables cualitativas) de una variable.
Un conjunto de datos mínimo está organizado en un formato rectangular que permite que la información sea legible por la computadora.
Los conjuntos de datos rectangulares, también llamados tabulares, se componen de columnas y filas y se asocian a una sola unidad de investigación u observación.
Partes básicas de una tabla de datos estructurada
Las filas del conjunto de datos representan a los sujetos (también llamados registros u observaciones) de sus datos.
Los sujetos de su conjunto de datos pueden ser personas, hogares, ubicaciones como países o provincias, etc.
Todas las observaciones de una tabla de datos pertenecen a una sola unidad de observación (entidad que deseamos estudiar, es decir, aquella que se observa para efectuar mediciones o para clasificarla en categorías)
Una base de datos es “una colección organizada de datos almacenados como múltiples conjuntos de datos”
El tipo de organización de estas bases de datos se denomina relacionales porque las observaciones de las tablas se “relacionan” entre sí mediante claves primarias y externas (foráneas).
Las tablas suelen representar distintas unidades de observación. También puede existir una tabla principal y otras auxiliares que conectan mediante códigos.
Son considerados datos abiertos todos aquellos datos accesibles y reutilizables, sin exigencia de permisos específicos.
Tiene una ética similar a otros movimientos y comunidades abiertos, como el software libre y el código abierto.
Hay una tendencia creciente de que la producción de datos públicos se compartan en el marco de open data para lxs ciudadanxs tengan acceso libre y la gestión sea transparente.
En nuestro país, tanto Estado nacional, como las provincias y municipios publican repositorios o banco de datos abiertos.
Veamos un ejemplo de datos abiertos sobre una encuesta de salud que se viene haciendo en Argentina desde 2005 cada 4 años aproximadamente.
Los responsables de llevarla a cabo son el Misniterio de Salud de la Nación y el INDEC.
Uno de sus sitios es: https://www.indec.gob.ar/indec/web/Institucional-Indec-BasesDeDatos-2
Instituto Nacional de Epidemiología